7B扩散语言模型单样例1000+ tokens/s!上交大联合华为推出LoPA 7B扩散语言模型单样例1000+ tokens/s!上交大联合华为推出LoPA 关键词: 模型训练,LoPA,扩散语言模型,AI,Lookahead Parallel Decoding ,时长 00:20 视频 1:单样例推理速度对比:SGLang 部署的 Qwen3-8B (NVIDIA) vs. LoPA-Dist 部署 (NVIDIA & Ascend)(注:NVIDIA 平台 来自主题: AI技术研报 7517 点击 2026-01-01 10:09